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Protease 

Gegenstand der vorliegenden Erfindung sind eine Protease, Nucleinsauren kodierend 
fur die Protease sowie die damit in Verbindung stehenden Inhibitoren, Antikorper, 
Arznei- und Diagnostikmittel. 

Die vorliegende Erfindung* stellt eine Protease mit zwei Asparatresten in einer 
katalytisch aktiven Struktur, wobei ein^ersteE#Asparatrest in * ekiem Motiv X l GX 2 GD 
liegt und ein*zweiter Aspartatrest in einem MotiV X3X4DX5 liegt, wobei X„ X 2 , X 3 und 
X 5 unabhSngig voneinander ausgewahlt werden aus Ala, Val, Leu, Met und lie und X 4 
eine aromatische Aminosaure ist, und die Motive XiGX^GD und X 3 X4DX 5 in einer 
Transmembranregion liegen, zur Verfugung. Fiir die Motive wurde der 
Einbuchstabencode der Aminosauren verwendet, d.h. D = Asp, G = Gly usw. 

Solche Proteasen sind mit hoher Wahrscheinlichkeit an der Spaltung des Amyloid 
Precursor Proteins (APP) beteiligt. In einer Ausfuhrungsform der Erfindung stellt die 
erfindungsgemaBe^Protease r die bisher^nicht identifizierte-y-Seeretase^dar, die an der 
ProzessieFung'des -A^ ist. 

Ein Uberblick tiber die Rolle der y-Secretasen bei der Entstehung der Alzheimerschen 
Erkrankung geben S.L. Ross et al. in J. of Biol. Chem. 273 (1998), 15309-15312. 
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Bevorzugte Proteasen der vorliegenden Erfindung weisen zusatzlich eine Sequenz 
PALXfiYXyVP auf, wobei und X 7 die gleiche Bedeutung haben wie X,. Es wird 
jedoch bevorzugt, daB X* und X 7 Leucin oder Isoleucin sind. 

Insbesondere handelt es sich bei den Proteasen um Proteasen von Saugetieren, 
insbesondere von Menschen. 

Die erfindungsgemaCen Proteasen weisen bevorzugt katalytisch aktive Aspartatreste 
in einer Region auf, die innerhalb eines Transmembranbereichs liegt 
Transmembranbereiche lassen sich bei Kenntnis der Sequenz eines Proteins aufgrund 
verschiedener Modelle vorhersagen. Sie sind dadurch gekennzeichnet, daB in einem 
Bereich ilberwiegend hydrophobe Aminosauren liegen, die von Bereichen flankiert 
werden, in denen eher hydrophile Aminosauren liegen. 

Ein Aspartat in einer Transmembranregion laBt sich beispielsweise durch Anwendung 
des Programms „GREASE" nachweisen, das Teil des FASTA 2.0 Programmpaketes 
ist. Bei einer Fensterbreite von 17 muB mit Hilfe dieses Programms ein 
Hydrophobizitatswert von mindestens 80 fur das Aspartat berechnet werden. Das 
FASTA-Programmpaket ist beschrieben in W. R. Pearson and D. J. Lipman, Proc. 
Natl. Acad. Sci. U.S.A. 85 (1988) 2444-2448. Das Programm GREASE benutzt den 
Kyte/Doolittle Algorithmic, beschrieben in J. Kyte and R. F. Doolittle, J. Mol. Biol. 
157(1982) 105-132. 

Besonders bevorzugte Proteasen der vorliegenden Erfindung werden als psl 1 - 4 
bezeichnet (humane psl 1 - 4: SEQ ID No. 1 bis 4, murine psl 2 - 4: SEQ ID No. 5 - 7, 
sacc. cerevisiae psl 3: SEQ ID No. 8, humane psl2L SEQ ID No. 18). 

Weiterhin sind Varianten der erfindungsgemaBen Proteasen Gegenstand der 
Erfindung. Varianten sind Proteine, die durch einen oder mehrere Mutationen, 
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Insertionen und Deletionen, insbesondere durch konservative Austausche, von den 
erfindungsgemaBen Proteasen abgeleitet sind, insbesondere N- oder C-terminal 
verkurzte oder verlangerte Formen. 

Auch Nucleinsauren, die fur die erfindungsgemaBen Proteasen kodieren, sind 
Gegenstand der Erfindung. Bevorzugte erfindungsgemaBe Nucleinsauren sind solche 
mit der SBQ ID No. 9 - 17 (human psl 1 - 4: SEQ ID No. 9 - 12, murine psl 2 - 4: 
SEQ ID No. 13 - 15, sacc. cerevisiae psl 3: SEQ ID No. 16, humane psl2L SEQ ID 
No. 17). Auch komplementare Nucleinsauren sind Bestandteil der Erfindung. 

Die erfindungsgemaBen Proteasen sind an der Spaltung des APP zum Ap beteiligt und 
sind damit indirekt an der Entstehung beispielsweise der Alzheimerschen Erkrankung 
beteiligt. Daher sind auch Inhibitoren, die die Expression*, oder die Aktivitat der 
Proteasen hemmen, Gegenstand der Erfindung. Solche Inhibitoren konnen in 
einfachen Verfahren identifiziert werden. Entspreehende Inhibitoren konnen 
beispielsweise durch Messung der Expression oder der Aktivitat der Proteasen in 
Gegenwart von potentiellen Inhibitoren identifiziert werden. Insbesondere zur 
Messung -der Expression eignen sich gegen die Aspartatprotesasen gerichtete 
Antikorper, die somit ebenfalls Bestandteil der Erfindung sind. 

Die erfindungsgemaBen Aspartatproteasen sind auch an der Spaltung anderer 
Transmembranproteine beteiligt, insbesondere des Rezeptorprotein Notch und 
verwandter Proteine, die in der Entwicklung des Nervensystems eine Rolle spielen. 
Die proteolytische Spaltungen im Inneren von Membranen ist auch an anderen 
wichtigen^Brozessen^beteiligt, z.B . : 
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• Proteolytischer Abbau von N-terminalen Signalpeptiden nach deren Abspaltung 
durch die Signalpeptidase. 

• Proteolytischer Abbau von C-terminalen Propeptiden, wie sie durch 
transamidase-katalysierte Abspaltung bei der posttranslationalen GPI- 
Verankerung von Proteinen entstehen. 

• Generierung von Peptiden fiir die Presentation durch Histokompatibilitats- 
Komplex Molekule vom Typ I und II. Bei loslichen Proteinen werden solch 
Peptide vornehmlich durch das Proteasom gebildet. Es entstehen jedoch auch 
Peptide aus Transmembranregionen von Proteinen, wie sie nur durch eine 
Spaltung im Inneren der Membran erklart werden konnen. 

Durch Einsatz der erfindungsgemaBen Protease bzw. deren Inhibitoren lassen sich 
die genannten Prozesse therapeutisch beeinflussen. 

Hierfiir eignen sich insbesondere Zell-Linien, die keine der erfindungsgemaBen 
Proteasen oder Nukleinsauren exprimieren und bevorzugt auch keine homologen 
Proteasen oder Nukleinsauren enthalten. Mit diesen laBt sich bevorzugt gemaB dem in 
Beispiel 1 beschriebenen Verfahren die Aktivitat der Proteasen testen bzw. Inhibitoren 
gemaB dem Beispiel 2 ermitteln. Besonders geeignet hierfiir ist Saccharomyces 
cerevisiae. In Kenntnis der entsprechenden Protease bzw. der kodierenden 
Nukleinsaure (SEQ ID No. 8 und 16) lassen sich nach bekannten Methoden 
Hefestamme herstellen, die dieses Protein bzw. die Nukleinsaure nicht mehr enthalten. 
Sie eignen sich daher bevorzugt als Expressionssystem zur Charakterisierung der 
erfindungsgemaBen Aspartatproteasen bzw. zur Identifizierung von geeigneten 
Inhibitoren. Entsprechende Zellinien, bevorzugt Hefezell-Linien sowie die 
Verwendung des Proteins mit der SEQ ID No. 8 als Aspartatprotease und der 
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Nukleinsaure mit der SEQ ID No. 16 zur Expression einer Protease sind daher 
ebenfalls Gegenstand der Erfindung. 

Die erfindungsgemaBen Proteasen, Nucleinsauren^nhibto konnen 
in Arznei^und Diagnostikmitteln enthalten sein. Sie eignen' sich insbesondere zur 
Behandlung oder Diagnose von Erkrankungen, die mit der Spaltung des Amyloid 
Precursor Proteins ursachlich verbunden sind, insbesondere der Alzheimerschen 
Erkrankung. 

Beispiel 1; 
y-Sekretase Assay 

Die putativen y-Sekretasen werden stabil oder transient in ;eos-7 Zellen transfiziert, 
die zusatzlich SpA4CT (Signaipeptid^ fusioniertr ai^ BA4* gefqlgt*vom APP C- 
Terminus) stabil exprimieren. y-Sekretase Aktivitat istantdiesertis System erkennbar 
durch die Generierung eines 4,6 »JKDa grbBen^ Peptides^ bzw. durch das 
Versehwifiden^der 11 KDa Bander des vollstandigeft SpA4tT. Bei Vorliegen der 
pathologiseh relevanten y-Sekretase* sMlten beide Fragmente im Inneren der Zelle zu 
detektieren sein. Im Uberstand der Zellen ist immer BA4 zu finden, das durch eine 
endogene plasmamembran-standige y-Sekretase Aktivitat generiert wird, die jedoch 
bei der Pathogenese von Alzheimer keine Rolle spielt. 

Die transfizierten Zellen werden dreimal mit kaltem DMEM gewaschen und 
nachfoIgencTauf Eis mit einern ZellschabeF,geerntet Die ^Zellen (caT'5>h() 6 Zellen) 
werdemdii*^ in kmL.feysis«fSer #5$#ftiM NaCl, 

5&mM Tris-HCa pH 7.5, 1 % NP-40, 1 % Triton-x^lOO, 2-mM EDTA) lysiert. Die 
Kerne, werden bei 11 000 g abzentrifiigiert. Der, Uberstand wird einer 
Immunprazipitation unterworfen. Hierzu werden 1 ml des Zellysates mit 2 p.g/ml 
W02 Immunglobulin (anti-BA4 Antikorper ) versetzt und 0,5 h bei 4°C iiber Kopf 
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geschuttelt. Nachfolgend werden 20 jxl Protein-G Sepharose Suspension (1:1) 
hinzugeben und 5 h bei 4°C uber Kopf geschuttelt. Die Protein-G Sepharose wird 
konsekutiv je zwei mal mit den Puffern A, B und C (A: 150 mM NaCl, 10 mM Tris- 
HC1 pH 7.5, 0. 2 % NP-40, 2 mM EDTA; B: 500 mM NaCl, 10 mM Tris-HCl pH 
7.5, 0. 2 % NP-40, 2 mM EDTA; C: 10 mM Tris-HCl pH 7.5) gewaschen, mit 20 jil 
3X Probenpuffer versetzt, auf 95°C erhitzt und der Uberstand auf ein 12 % Tris- 
Tricine Gel aufgetragen. Nach der gelelektrophoretischen GroBenfraktionierung 
werden die Proteine auf eine PVDF-Membran transferiert und nachfolgend mit 
einem anti-fiA4 Antikorper nachgewiesen. 

Beispiel 2: 

Identifizierung eines y-Sekretase Inhibitors 

Zur Identifizierung eines Inhibitors der pathologisch relevanten y-Sekretase wird das 
Enzym nach der obigen Vorschrift in cos-7 Zellen mit SpA4CT coexprimiert Die 
Zellen werden in geeigneter Weise mit der zu untersuchenden Substanz in Kontakt 
gebracht (in Gegenwart oder Abwesenheit von membran-permeabilisierenden 
Agentien). Anschliessend wird das intrazellular gebildete BA4 wie oben beschrieben 
nachgewiesen. Eine Verringerung der gebildeten Menge 6A4 laBt auf eine 
Wirksamkeit der Substanz als y-Sekretase Inhibitor schliessen. 
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Patentansprtiche 



1. Protease -mit zwei Asparatresten in einer katalytisch aktiven Struktur, wobei 
ein erster Asparatrest in einem Motiv XiGX 2 GD liegt und ein zweiter 
Aspartatrest in einem Motiv X3X4DX5 liegt, wobei X„ X 2 , X 3 und X 5 
unabhangig voneinander ausgewahlt werden aus Ala, Val, Leu, Met und lie 
und X4 eine aromatische Aminosaure ist, und die Motive X l GX 2 GD und 
X3X4DX5 in einer Transmembranregion liegen. 

2. Protease nach Anspruch 1, dadurch gekennzeichnet, daB die Protease die 
Sequenz PALX 6 YX 7 VB.aufweist, wobei X 6 und X 7 die gleiche Bedeutung 
haben wie Xfund bevorzugt Leu oder lie sind. 

3. Protease nach einem der Anspriiche 1 bis 2, dadurch gekennzeichnet, daB die 
Protease eine der Sequenzen SEQ ID No. 1-8 und 18 aufweist 

4. Nucleinsauren kodierend fur eine Protease nach mindestens einem der 
Anspriiche 1 bis 3, bevorzugt mit der SEQ ID No. 9-17. 

5. Inhibitoren, dadurch gekennzeichnet, daB sie die Expression oder Aktivitat 
der Protease nach einem der Anspriiche 1 bis 3 hemmen. 

6. Antikorper, gerichtet gegen Proteasen nach einem der Anspriiche 1 bis 3. 

7. Wrfahren^^ von Inhibitoren, dadurch gekennzeichnet, daB 
die Aktivitat der Proteasen-nach einem der Anspriiche U bis 3 i#6egenwart 
von potentiellen Inhibitoren gemessen wird. 
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8. Arzneimittel oder Diagnostikmittel enthaltend eine Protease nach einem der 
Anspruche 1 bis 3, eine Nucleinsaure nach Anspruch 4, einen Inhibitor nach 
Anspruch 5 und/ oder einen Antikorper nach Anspruch 6. 

9. Verwendung des Arzneimittels oder Diagnostikmittelns nach Anspruch 8 zur 
Diagnose oder Behandlung von Erkrankungen, die mit der Spaltung des 
Amyloid Precursor Proteins ursachlich verbunden sind, insbesondere der 
Alzheimerschen Erkrankung. 

10. Zell-Linie, dadurch gekennzeichnet, dafi die Zell-Linie keine Protease gemafi 
mindestens einem der Anspruche 1 bis 3 exprimiert und/oder keine 
Nukleinsaure nach Anspruch 4 enthalt. 
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Zusammenfassung 



Protease*mit zwei Asparatresten in einer* katalytisch aktiven Struktur, wobei ein erster 
Asparatrest in einem Motiv X,GX 2 GD liegt und ein zweiter * Aspartatrest in einem 
Motiv X3X4DX5 liegt, wobei X„ X 2 , X 3 und X 5 unabhangig voneinander ausgewahlt 
werden aus Ala, Val, Leu, Met und He und X» eine aromatische Aminosaure ist, und 
die Motive X,GX 2 GD und X3X4DX5 in einer Transmembranregion liegeri. 



SEQUENZPROTOKOLL 

<110> Memorec Stoffel GmbH 

<120> Protease 

<130> Protease Memorec 

<140> 
<141> 

<160> 16 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 592 
<212> PRT 

<213> Homo sapiens 
<400> 1 

Met Ala Ala Ala Val Ala Ala Ala Leu Ala Arg Leu Leu Ala Ala Phe 
1 5 10 15 

Leu Leu Leu Ala Ala Gin Val Ala Cys Glu Tyr Gly Met Val His Val 

20 25 ""30 

Val Ser Gin Ala Gly Gly Pro Glu Gly Lys Asp Tyr Cys lie Leu Tyr 
35 40 45 

Asn Pro Gin Trp Ala His Leu Pro His Asp Leu Ser Lys Ala Ser Phe 
50 55 60 

Leu Gin Leu Arg Asn Trp Thr Ala Ser Leu Leu Cys Ser Ala Ala Asp 
65 70 75 80 

Leu Pro Ala Arg Gly Phe Ser Asn Gin He Pro Leu Val Ala Arg Gly 
85 90 95 

Asn Cys Thr Phe Tyr Glu Lys Val Arg Leu Ala Gin Gly Ser Gly Ala 
100 105 HO 

Arg Gly Leu Leu He Val Ser Arg Glu Arg Leu Val Pro Pro Gly Gly 
115 120 - 125 

Asn Lys Thr Gin Tyr Asp Glu He Gly He Pro Val Ala Leu Leu Ser 
130 135 14Q 
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Tyr Lys Asp Met Leu Asp He Phe Thr Arg Phe Gly Arg Thr Val Arg 
145 150 155 160 

Ala Ala Leu Tyr Ala Pro Lys Glu Pro Val Leu Asp Tyr Asn Met Val 
165 170 175 

He He Phe He Met Ala Val Gly Thr Val Ala lie Gly Gly Tyr Trp 
180 -185 190 

Ala Gly Ser Arg Asp Val Lys Lys Arg Tyr Met Lys His Lys Arg Asp 
19 5 200 205 

Asp Gly Pro Glu Lys Gin Glu Asp Glu Ala Val Asp Val Thr Pro Val 
21 0 215 220 

Met Thr Cys Val Phe Val Val Met Cys Cys Ser Met Leu Val Leu Leu 
225 2 30 235 240 

Tyr Tyr Phe Tyr Asp Leu Leu Val Tyr Val Val He Gly He Phe Cys 
245 250 255 

Leu Ala Ser Ala Thr Gly. Leu Tyr- Ser Cys-Leu> Ala Pro Cys Val Arg 
260 265 270 

Arg Leu Pro Phe Gly Lys Cys Arg lie: Pro Asn Asn , Ser Leu Pro Tyr 
27 5 280 - 285 

Phe His Lys Arg Pro Gin. Ala Arg -Met Leu Leu Leu Ala Leu Phe Cys 
2 ^0 295 300 

Val Ala Val Ser Val Val Trp Gly Val Phe Arg Asn Glu Asp Gin Trp 
305 310 315 320 

Ala Trp Val Leu Gin Asp Ala Leu Gly He Ala Phe Cys Leu Tyr Met 
325 330 335 

Leu Lys Thr He Arg Leu Pro Thr Phe Lys Ala Cys Thr Leu Leu Leu 
34 ° 345 350 

Leu Val, Leu^Phe.,Leu Tyr**- Asp f Ile Phe *Phe-- Val- Phe lie Thr Pro Phe 
355 360 365 

Leu Thr Lys Ser Gly Ser Ser Ile^Met Val Glu Val Ala Thr Gly Pro 
370 375 380 

Ser Asp Ser Ala Thr Arg Glu Lys Leu Pro Met Val Leu Lys Val Pro 
385 390 395 400 



2 



Arg Leu Asn Ser Ser Pro Leu Ala Leu Cys Asp Arg Pro Phe Ser Leu 
405 410 415 

Leu Gly Phe Gly Asp lie Leu Val Pro Gly Leu Leu Val Ala Tyr Cys 
420 425 430 

His Arg Phe Asp He Gin Val Gin Ser Ser Arg Val Tyr Phe Val Ala 
435 440 445 

Cys Thr He Ala Tyr Gly Val Gly Leu Leu Val Thr Phe Val Ala Leu 
450 455 460 

Ala Leu Met Gin Arg Gly Gin Pro Ala Leu Leu Tyr Leu Val Pro Cys 
465 470 475 480 

Thr Leu Val Thr Ser Cys Ala Val Ala Leu Trp Arg Arg Glu Leu Gly 
485 490 495 

Val Phe Trp Thr Gly Ser Gly Phe Ala Lys Val Leu Pro Pro Ser Pro 
500 505 510 

Trp Ala Pro Ala Pro Ala Asp Gly Pro Gin Pro Pro Lys Asp Ser Ala 
515 520 525 

Thr Pro Leu Ser Pro Gin Pro Pro Ser Glu Glu Pro Ala Thr Ser Pro 
530 535 540 

Trp Pro Ala Glu Gin Ser Pro Lys Ser Arg Thr Ser Glu Glu Met Gly 
545 550 555 560 

Ala Gly Ala Pro Met Arg Glu Pro Gly Ser Pro Ala Glu Ser Glu Gly 
565 570 575 

Arg Asp Gin Ala Gin Pro Ser Pro Val Thr Gin Pro Gly Ala Ser Ala 
580 585 590 



<210> 2 
<211> 313 
<212> PRT 

<213> Homo sapiens 
<400> 2 

Met Arg Lys Lys Lys Glu Glu Tyr Leu Thr Phe Ser Pro Leu Thr Val 
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10 



15 



Val lie Phe Val Val He Cys Cys Val Met Met Val Leu Leu Tyr Phe 
20 25 30 

Phe Tyr Lys Trp Leu Val Tyr Val Met He Ala He Phe Cys He Ala 
35 40 45 

Ser Ala Met Ser Leu Tyr Asn Cys Leu Ala Ala Leu He His Lys lie 
5 ° 55 60 

Pro Tyr Gly Gin Cys Thr He Ala Cys Arg Gly Lys Asn Met Glu Val 
65 70 75 80 



Arg Leu He Phe Leu Ser Gly Leu Cys He Ala Val Ala Val Val Trp 
85 90 95 

Ala Val Phe Arg Asn Glu Asp Arg Trp Ala Trp He Leu Gin Asp He 
100 105 no 



Leu Gly He Ala Phe Cys- Leu. Asn -Leu -lie Lys Thr leu Lys Leu Pro 

120 125 

Asn Phe Lys Ser Cys Val He Leu. Leu Gly Leu Leu Leu Leu Tyr Asp 
130 135 140 



Val Phe Phe Val Phe He Thr Pro Phe He Thr Lys Asn Gly Glu Se 
145 150 155 



r 

160 



He Met Val Glu Leu Ala Ala Gly Pro Phe Gly Asn Asn Glu Lys Leu 
165 170 175 

Pro Val Val He Arg Val Pro Lys Leu He Tyr Phe Ser Val Met Ser 
180 185 190 

Val Cys Leu Met Pro Val Ser He Leu Gly Phe Gly Asp He He Val 
i95 200 205 

Pro Gly Leu Leu lie Ala Tyr Cys Arg Arg Phe Asp Val Gin Thr Gly 
210 215 220 

Ser Ser Tyr He Tyr Tyr Val Ser Ser Thr Val Ala Tyr Ala He Gly 
225 230 235 240 

Met He Leu Thr Phe Val Val Leu Val Leu Met Lys Lys Gly Gin Pro 
245 250 255 



Ala Leu Leu Tyr Leu Val Pro Cys Thr Leu He Thr Ala Ser Val Val 
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260 

Ala Trp Arg Arg Lys Glu 
275 

Gin Met Met Asp His Leu 
290 

lie Ser Gly Glu Gin lie 
305 310 



265 

Met Lys Lys Phe Trp 
280 

Asp Cys Ala Thr Asn 
295 

Val Gin Gin 




270 

Lys Gly Asn Ser Tyr 
285 

Glu Glu Asn Pro Val 
300 



<210> 3 
<211> 377 
<212> PRT 

<213> Homo sapiens 
<400> 3 

Met Asp Ser Ala Leu Ser Asp Pro His Asn Gly Ser Ala Glu Ala Gly 
1 5 io 15 

Gly Pro Thr Asn Ser Thr Thr Arg Pro Pro Ser Thr Pro Glu Gly lie 
20 25 30 

Ala Leu Ala Tyr Gly Ser Leu Leu Leu Met Ala Leu Leu Pro He Phe 
35 40 45 

Phe Gly Ala Leu Arg. Ser Val Arg Cys Ala Arg Gly Lys Asn Ala Ser 
50 55 60 

Asp Met Pro Glu Thr He Thr Ser Arg Asp Ala Ala Arg Phe Pro He 
65 70 75 80 

He Ala Ser Cys Thr Leu Leu Gly Leu Tyr Leu Phe' Phe Lys He Phe 
85 90 95 

Ser Gin Glu Tyr He Asn Leu Leu Leu Ser Met Tyr Phe Phe Val Leu 
100 105 no 

Gly He Leu Ala Leu Ser His Thr He Ser Pro Phe Met Asn Lys Phe 
115 120 125 

Phe Pro . Ala Ser Phe Pro Asn Arg -Gin Tyr Gin Leu Leu Phe Thr Gin 
13 0 135 140 

Gly Ser Gly Glu Asn Lys Glu Glu He He Asn Tyr Glu Phe Asp Thr 
145 150 155 160 
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Lys Asp Leu Val Cys Leu Gly Leu Ser Ser He Val Gly Val Trp Tyr 
165 170 1?5 

Leu Leu Arg Lys His Trp He Ala Asn Asn Leu Phe Gly Leu Ala Phe 
180 185 19Q 

Ser Leu Asn' Gly Val Glu. Leu Leu His Leu Asn Asn Val -Ser Thr Gly 
195 200 



Cys lie Leu Leu Gly Gly Leu Phe He Tyr Asp Val Phe Trp Val Phe 

220 



210 215 



Gly Thr Asn Val Met Val Thr Val Ala Lys Ser Phe Glu Al 
225 230 235 



a Pro He 
240 



Lys Leu Val Phe Pro Gin Asp Leu Leu Glu Lys Gly Leu Glu Ala Asn 
245 250 255 

Asn Phe Ala Met Leu Gly Leu Gly Asp Val Val He Pro Gly He Phe 



260 



265 



270 



He Ala Leu Leu Leu Arg Phe Asp He Ser Leu- Lys^Lys Asn Thr Hi< 



275 



280 



285 



Thr Tyr Phe Tyr Thr Ser Phe Ala Ala Tyr I lev Phe Gly Leu Gly Leu 
290 295 300 

Thr He Phe He- Met His lie Phe Lys -His Ala-Gin Pro Ala. 



305 310 



Leu, Leu 
315 320 



Tyr Leu Val Pro Ala Cys He Gly Phe Pro Val Leu Val Ala Leu Ala 
325 330 335 

Lys Gly Glu Val Thr Glu Met Phe Ser Tyr Glu Glu Ser Asn Pro Lys 
340 345 3 5o 

Asp Pro Ala Ala Val Thr Glu Ser Lys Glu Gly Thr Glu Ala 



355 3 60 

Ser Lys Gly^Leu-Glu *Lys Lys Glu Lys 
370 375 



Ser Ala 
365 



<210> 4 
<211> 384 
<212> PRT 
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<213> Homo sapiens 



<400> 4 



Met Ala Glu Gin Thr Tyr Ser Trp Ala Tyr Ser Leu Val Asp Ser Ser 
1 5 10 15 

Gin Val Ser Thr Phe Leu lie Ser He Leu Leu He Val Tyr Gly Ser 
20 25 30 

Phe Arg Ser Leu Asn Met Asp Phe Glu Asn Gin Asp Lys Glu Lys Asp 
35 40 45 

Ser Asn Ser Ser Ser Gly Ser Phe Asn Gly Asn Ser Thr Asn Asn Ser 
50 55 60 

He Gin Thr He Asp Ser Thr Gin Ala Leu Phe Leu Pro He Gly Ala 
65 70 75 80 

Ser Val Ser Leu Leu Val Met Phe Phe Phe Phe Asp Ser Val Gin Val 
85 90 95 

Val Phe Thr He Cys Thr Ala Val Leu Ala Thr lie Ala Phe Ala Phe 
100 105 no 

Leu Leu Leu Pro Met Cys Gin Tyr Leu Thr Arg Pro Cys Ser Pro Gin 
115 120 125 

Asn Lys He Ser Phe Gly Cys Cys Gly Arg Phe Thr Ala Ala Glu Leu 
130 135 14Q 

Leu Ser Phe Ser Leu Ser Val Met Leu Val Leu He Trp Val Leu Thr 
145 150 155 160 

Gly His Trp Leu Leu Met Asp Ala Leu Ala Met Gly Leu Cys Val Ala 
I 65 170 175 • 

Met He Ala Phe Val Arg Leu Pro Ser Leu Lys Val Ser Cys Leu Leu 
180 185 190 

Leu Ser Gly Leu Leu He Tyr Asp Val Phe Trp Val Phe Phe Ser Ala 
195 200 205 

Tyr He Phe Asn Ser Asn Val Met Val Lys Val Ala Thr Gin Pro Ala 
210 215 220 

Asp Asn Pro Leu Asp Val Leu Ser Arg Lys Leu His Leu Gly Pro Asn 
225 230 235 240 
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Val Gly Arg Asp Val Pro Arg Leu Ser Leu Pro Gly Lys Leu Val Phe 
245 250 255 

Pro Ser Ser Thr Gly Ser His Phe Ser Met Leu Gly He Gly Asp He 
260 265 270 

Val Met Pro Gly Leu Leu Leu Cys Phe Val Leu Arg Tyr Asp Asn Tyr 
275 280 285 

Lys Lys Gin Ala Ser Gly Asp Ser Cys Gly Ala Pro Gly Pro Ala Asn 
290 295 300 

He Ser Gly Arg Met Gin Lys Val Ser Tyr Phe His Cys Thr Leu He 
305 ii n -,, c 

J1U 315 320 

Gly Tyr Phe Val Gly Leu Leu Thr Ala Thr Val Ala Ser Arg He His 
325 33 0 335 

Arg Ala Ala Gin Pro Ala Leu Leu Tyr Leu Val Pro Phe Thr Leu Leu 
. 340 345 350 

Pro Leu Leu- Thr Met Ala Tyr Leu -Lys Gly. .Asp Leu Arg Arg Met Trp 
355 3 6 o 3 65 

Ser Glu Pro Phe His Ser Lys Ser Ser Ser Ser Arg" -Phe Leu Glu Val 
370 375 380 



<210> 5 
<211> 113 
<212> PRT 

<213> Mus musculus 
<400> 5 

Val Leu Gly* Phe. Gly Asp He He Val Pro Gly Leu Leu He Ala Tyr 
1 5 10 15 

Cys. Arg«Arg«Phe Asp Val Gin* Thr' Gly 'Ser Ser He Tyr Tyr He Ser 
20 25 30 

Ser Thr He Ala Tyr Ala Val Gly Met He He Thr Phe Val Val Leu 
35 40 45 

Met Val Met Lys Thr Gly Gin Pro Ala Leu Leu Tyr Leu Val Pro Cys 
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50 55 60 

Thr Leu lie Thr Val Ser Val Val Ala Trp Ser Arg Lys Glu Met Lys 



65 



70 



75 



80 



Lys Phe Trp Lys Gly Ser Ser Tyr Gin Val Met Asp His Leu Asp Tyr 
85 go 95 

Ser Thr Asn Glu Glu Asn Pro Val Thr Thr Asp Glu Gin lie Val Gin 
1( >0 105 no 

Gin 



<210> 6 
<211> 378 
<212> PRT 

<213> Mus musculus 



<400> 6 

Met Asp Ser Ala 

1 

Thr Pro Ala Asn 
20 

Ala Leu Ala Tyr 
35 

Phe Gly Ala Leu 
50 

Asp Met Pro Glu 
65 

He Ala Ser Cys 



Ser Gin Glu Tyr 
100 

Gly lie Leu Ala 
115 

Phe Pro Ala Asn 
130 



Val Ser Asp Pro 
5 

Gly Thr Thr Arg 



Gly Ser Leu Leu 
40 

Pro Ser Val Arg 

55. 

Thr He Thr Ser 
70 

Thr Leu Leu Gly 
85 

He Asn Leu Leu 



Leu Ser His Thr 
120 

Phe Pro Asn Arg 
135 



His Asn Gly Ser 
10 

Pro Pro Ser Thr 
25 

Leu Met Ala Leu 



Cys Ala Arg Gly 
60 

Arg Asp Ala Ala 

Leu Tyr Leu Phe 
90 

Leu Ser Met Tyr 
105 

lie Ser Pro Phe 



Gin Tyr Gin Leu 
140 



Ala Glu Ala Gly 
15 

Pro Glu Gly He 
30 

Leu Pro He Phe 
45 

Lys Ser Ser Ser 



Arg Phe Pro He 
80 

Phe Lys lie Phe 
95 

Phe Phe Val Leu 
110 

Met Asn Lys Phe 
125 

Leu Phe Thr Gin 
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Gly Ser Gly Glu Asn Lys Glu Glu He He Asn Tyr Glu Phe Asp Thr 
145 150 155 160 

Lys Asp Leu Val Cys Leu Gly Leu Ser Ser Val Val Gly Val Trp Tyr 
165 170 175 

Leu LeuuArg.. Lys HisvTrp He Ala , Asm *Asn ><Leu Phe .Gly Leu Ala Phe 
180 185 190 

Ser Leu Asn Gly Val Glu Leu Leu His Leu Asn Asn Val Ser Thr Gly 
195 200 205 

Cys He Leu Leu Gly Gly Leu Phe lie Tyr Asp lie Phe Trp Val Phe 
210 215 220 

Gly Thr Asn Val Met Val Thr Val Ala Lys Ser Phe Glu Ala Pro He 
225 230 235 240 

Lys Leu Val Phe Pro Gin Asp Leu Leu Glu Lys Gly Leu Glu Ala Asp 
24 5 ,250 , 255 

Asn Phe Ala- Met Leu- Gly* Leu Gly Asp He yal lie -Pro Gly He -Phe 
260 265 270 

He Ala Leu -Leu Leu Arg~'Phe~Asp Ile>.Ser Leu LysrLys Asri Thr His 
275 m&0 285 

Thr Tyr Phe Tyr'Thr Ser' Phe Ala- Ala Tyr He Phe Gly Leu Gly Leu 
290 295 300 

Thr He Phe He Met His He Phe Lys His Ala Gin Pro Ala Leu Leu 
305 310 315 320 

Tyr Leu Val Pro Ala Cys He Gly Phe Pro Val Leu Val Ala Leu Ala 
325 330 335 

Lys Gly Glu Val Ala Glu Met Phe Ser Tyr Glu Glu Ser Asn Pro Lys 
340 345 .350 

Asp; :Bro^hl^A^a^V2Lj^hr^Glum'et>mys Glu Glu-Ser-Thr^ -Glu-Ala^ Ser 
^355 • 360 . 365 

Ala Ser Lys Arg Leu Glu Lys Lys -Glu Lys 
370 375 
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<210> 7 
<211> 257 
<212> PRT 

<213> Mus musculus 



<400> 7 

Gin Asn Lys He Ser Phe Gly Cys Cys Gly Arg Phe Thr Ala Ala Glu 
1 5 io 15 

Leu Leu Ser Phe Tyr Leu Ser Val Met Leu Val Leu He Trp Val Leu 
20 25 30 

Thr Gly His Trp Leu Leu Met Asp Ala Leu Ala Met Gly Leu Cys Val 
35 40 45 

Ala Met He Ala Phe Val Arg Leu Pro Ser Leu Lys Val Ser Cys Leu 
50 55 60 

Leu Leu Ser Gly Leu Leu He Tyr Asp Val Phe Trp Val Phe Phe Ser 
65 7 0 75 so 

Ala Tyr He Phe Asn Ser Asn Val Met Val Lys Val Ala Thr Gin Pro 
85 90 95 

Ala Asp Asn Pro Leu Asp Val Leu Ser Arg Lys Leu His Leu Gly Pro 
100 105 no 

Asn Val Gly Arg Asp Val Pro Arg Leu Ser . Leu Pro Gly Lys Leu Val 
115 120 125 

Phe Pro Ser Ser Thr Gly Ser His Phe Ser Met Leu Gly He Gly Asp 
130 135 140 



He Val Met Pro Gly Leu Leu Leu Cys Phe Val Leu Arg Tyr Asp Asn 

160 



145 150 155 



Tyr Lys Lys Gin Ala Ser Gly Asp Ser Cys Gly Ala Pro Gly Xaa Ala 
165 170 175 

Asn He Ser Gly Arg Met Gin Lys Val Ser Tyr Phe His Cys Thr Leu 
180 185 190 

He Gly Tyr Phe Val Gly Leu Leu Thr Ala Thr Val Ala Ser Arg Val 
195 200 . 205 

His Arg Ala Ala Gin Pro Ala Leu Leu Tyr Leu Val Pro Phe Thr Leu 
210 215 220 
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Leu Pro Leu Leu Thr Met Ala.Tyr Leu Lys Gly Asp Leu Arg Arg Met 
225 230 235 240 

Trp Ser Glu Pro Phe His Ser Lys Ser Ser Ser Ser Arg Phe Leu Glu 
245 250 255 

Val 



<210> 8 
<211> 587 
<212> PRT 

<213> Saccharomyces cerevisiae 
<400> 8 

Met Asp Lys Tyr Leu Asn Ser Phe Val Asp His Leu Ser Glu Trp Ser 
1 5 10 15 

Ser Arg Ala Phe Arg. Asn Asn Ser Ser , Ser Ala ,Asn Gln^Ser Ala Ser 
* 20 25 30 

Asn Lys Glu Leu Glu Gin Val Phe Glu Gin Ile^Asn Ala lie Val Glu 

35 :% .4 0 4 5 

Asn His- Asn Asn Lys Leu Thr ' Thr Ala Phe Asp Lys lie Ser Tyr Arg 
50 55 60 

Val Ala His Lys He Thr His Leu Val Glu Ser His Ser Leu Val Phe 
65 70 75 80 

Asn Tyr Ala Thr Leu Val Leu He Ala Ser Ala Leu Val Val He Gly 
85 90 95 

Ser Phe Thr Ser He Ser Ser lie Pro Phe Thr Ala Leu Pro Pro Thr 
100 105 HO 

Arg Glu His Ser Leu Phe Asp Pro Thr Asp Phe Asp Val<vAsp His -Asp 
115 120 125 

Cys HistffcVal^He Tyr Arg Glu Asn* Asp Glu Asp Lys Lys Lys Lys Lys 
130 135 14 0 

Lys Ser Lys Arg Phe Phe Asp Met Met Asp Glu Lys His Ala He He 
145 150 155 160 

Leu Pro Leu Thr Ser Gly Cys Thr Leu Leu Ala Leu Tyr Phe Val He 
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165 



170 



175 



Lys Lys Leu His Leu Asn Trp. Leu Lys Tyr Val Val Lys lie Leu Asn 
180 185 !9o 

Phe Asn He Thr Leu Leu Asn He Pro Ala Gly Thr Phe Val Tyr Ser 
195 200 205 

Tyr Phe Leu Asn Ser Leu Phe Arg Asn Leu Ser His Leu Ala Ser Trp 
210 215 220 

Asn Pro Leu Val Val Leu Pro Arg Tyr Arg Val Thr He Ala Asp Asp 
225 230 235 240 

Asn Glu Asp Leu Asn Lys He Gly Gly Phe Val Thr Asn Leu Asn Tyr 
245 250 255 

Lys Asp Gly Leu Thr Asn Ser Val Val His Lys Lys Thr Leu Asp Glu 
260 265 270 

He Glu Lys Asp His Trp Met Lys His Phe Tyr Arg Arg Glu Leu Val 
275 280 285 

Glu Pro Lys Asp He Lys Ser Lys Arg Gin He Ser Asn Met Tyr Leu 
290 295 300 

Asn Ser Ala Leu He Val Ser Phe Val Leu Ser He Val Ser Thr Val 
305 310 315 320 

Tyr Phe Tyr Leu Ser Pro Asn Asp Trp Leu He Ser Asn Ala Val Ser 
325 330 335 

Met Asn Met Ala He Trp Ser He Ala Gin Leu Lys Leu Lys Asn Leu 
340 345 350 

Lys Ser Gly Ala Leu He Leu He Ala Leu Phe Phe Tyr Asp He Cys 
355 360 365 

Phe Val Phe Gly Thr Asp Val Met Val Thr Val Ala - Thr Asn Leu Asp 
370 375 380 

He Pro Val Lys Leu Ser Leu Pro Val Lys Phe Asn Thr Ala Gin Asn 
385 3 90 395 400 

Asn Phe Asn Phe Ser He Leu Gly~Leu Gly Asp He Ala Leu Pro Gly 
405 410 415 



Met Phe He Ala Met Cys Tyr Lys Tyr Asp He Trp Lys Trp His Leu 
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420 

Asp His Asp Asp 
4 35 

Lys Tyr Phe lie 
450 

Ala Met Val Ser 
465 

Tyr lie Val Pro 



Asn Lys Asp Phe 
500 




Thr Glu Phe His 
440 

Thr Ala Met Val 
455 

Leu Ser lie Phe 
470 

Ser Leu Leu lie 
485 

Lys Gin Phe Trp 



425 

Phe Leu Asn Trp 



Ser Tyr Val Ala 
460 

Asn Thr Ala Gin 
475 

Ser Thr lie Leu 
490 

Asn Phe Gin Tyr 
505 




430 

Ser Tyr Val Gly 
445 

Ser Leu Val Ser 



Pro Ala Leu Leu 
480 

Val Ala Cys Trp 
495 

Asp Thr lie Glu 
510 



Val Asp Lys Ser Leu Lys Lys Ala lie Glu Lys Lys Glu Asn Ser He 
515 520 525 

Thr Tyr Ser Thr Phe He Leu Ser Glu Tyr Tyr Asn Asp Ala Asp Lys 
530 535 540 

Tyr Ala Leu Leu Gly Asp Asp Val Asn Glu Asn Phe Asp. Asp Asp Glu 
545 550 555 560 

Glu Phe Val Gin Glu Glu Asp Leu Ser Asp Ser Ser Glu Glu Glu Leu 
565 570 575 

Ser Glu Glu Asp Leu Leu Asp Asp Glu Ser Ser 
580 585 



<210> 9 
<211> 1776 
<212> DNA 

<213> Saccharomyces cerevisiae 
<400> 9 

atggeggcag cggtggeggc tgegctggcg 
gcccaggtgg cctgtgagta cggcatggtg 
ggcaaagact actgcatcct ctaeaacccg 
aaggcatctt tcctgcagct gcgcaactgg- 
ctccccgccc gtggcttcag caaccagatc 
tatgagaaag tgaggctggc ccagggcagc 
gagaggctgg tccccccggg gggtaataag 
gccctgctca gctacaaaga catgctggac 



cggcttttgg cggcctttct gctcctcgcg 60 
cacgtggtct cccaggccgg gggccccgaa 120 
cagtgggccc atcttccgca cgacctcagc 180 
acggcctccc tgctctgctc cgcagccgac 24 0 
ccgctggtgg cgcgggggaa ctgcaccttc 300 
ggagcacgcg ggctgctcat cgtcagcagg 360 
acgcagtatg atgagattgg cattcccgtg 420 
atcttcacgc gtttcggccg cacggtgagg 480 
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gcggcgctgt atgcgcctaa ggagccggtg ctggactaca acatggtcat catcttcatc 54 0 
atggctgtgg gcaccgtcgc catcggcggc tactgggccg ggagtcggga cgtgaagaaa 600 
aggtacatga agcacaagcg cgacgatggg cccgagaagc aggaggacga ggcggtggac 660 
gtgacgccgg tgatgacctg cgtgtttgtg gtgatgtgct gctccatgct ggtgctgctc 720 
tactacttct acgacctcct cgtgtacgtg gtcatcggga tcttctgcct ggcctccgcc 780 
accggcctct acagctgcct ggcgccctgt gtgcggcggc tgcccttcgg caagtgcagg 840 
atccccaaca acagcctgcc ctacttccac aagcgcccgc aggcccgtat gctgctcctg 900 
gcgctcttct gcgtggccgt cagcgtggtg tggggcgtct tccgcaacga ggaccagtgg 960 
gcctgggtcc tccaggatgc cctgggcatc gccttctgcc tctacatgct gaagaccatc 1020 
cgtctgccca ccttcaaggc ctgcacgctg ctgctgctgg tgctgttcct ctacgacatc 1080 
ttcttcgtgt tcatcacgcc cttcctgacc aagagtggga gcagcatcat ggtggaggtg 114 0 
gccactgggc cctcggactc agccacccgt gagaagctgo ccatggtcct gaaggtgccc 1200 
aggctgaact cctcacctct ggccctgtgt gaccggccct tctccctcct gggtttcgga 1260 
gacattttgg tgccagggct gctggtggcc tactgccaca ggtttgacat ccaggtacag 1320 
tcctccaggg tatacttcgt ggcctgcacc atcgcctatg gcgttggcct ccttgtgaca 1380 
ttcgtggcac tggccctgat gcagcgtggc cagcccgctc tcctctacct ggtgccctgc 14 4 0 
acgctggtga cgagctgcgc tgtggcgctc tggcgccggg agetgggcgt gttctggacg 1500 
ggcagcggct ttgcgaaagt cctacctcca tctccgtggg ccccagcacc agccgacggc 1560 
ccgcagcctc ccaaagactc tgccacgcca ctctccccgc agccgcccag cgaagaacca 1620 
gccacatccc cctggcctgc tgagcagtcc ccaaaatcac gcacgtccga ggagatgggg 1680 
gctggagccc ccatgcggga gcctgggagc ccagctgaat ccgagggccg ggaccaggcc 1740 
cagccgtccc cggtaaccca gcctggcgcc tcggcc 1776 




<210> 10 

<211> 939 

<212> DNA 

<213> Homo sapiens 

<400> 10 

atgaggaaaa agaaggaaga atatttaact tttagtcctc ttacagttgt aatatttgtg 60 
gtcatctgct gtgttatgat ggtcttactt tatttcttct acaaatggtt ggtttatgtt 120 
atgatagcaa ttttctgcat agcatcagca atgagtctgt acaactgtct tgctgcacta 180 
attcataaga taccatatgg acaatgcacg attgcatgtc gtggcaaaaa catggaagtg 24 0 
agacttattt ttctctctgg actgtgcata gcagtagctg ttgtttgggc tgtgtttcga 300 
aatgaagaca ggtgggcttg gattttacag gatatcttgg ggattgcttt ctgtctgaat 360 
ttaattaaaa cactgaagtt gcccaacttc aagtcatgtg tgatacttct aggccttctc 420 
ctcctctatg atgtattttt tgttttcata acaccattca tcacaaagaa tggtgagagt 480 
atcatggttg aactcgcagc tggacctttt ggaaataatg aaaagttgcc agtagtcatc 540 
agagtaccaa aactgatcta tttctcagta atgagtgtgt gcctcatgcc tgtttcaata 600 
ttgggttttg gagacattat tgtaccaggc ctgttgattg catactgtag aagatttgat 660 
gttcagactg gttcttctta catatactat gtttcgtcta cagttgccta tgctattggc 720 
atgatactta catttgttgt tctggtgctg atgaaaaagg ggcaacctgc tctcctctat 780 
ttagtacctt gcacacttat tactgcctca. gttgttgcct ggagacgtaa ggaaatgaaa 840 
aagttctgga aaggtaacag ctatcagatg atggaccatt tggattgtgc aacaaatgaa 900 
gaaaaccctg tgatatctgg tgaacagatt gtccagcaa 939 
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<210> 11 

<211> 1131 

<212> DNA 

<213> Homo sapiens 

<400> 11 

atggactcgg ccctcagcga tccgcataac ggcagtgccg aggcaggcgg ccccaccaac 60 
agcactacge « ggccgccttc cacgcccgag ggcatcgcgc tggcctacgg cagcctcctg 120 
ctcatggcgc tgctgcccat cttcttcggc gccctgcgct ccgtacgctg cgcccgcggc 180 
aagaatgctt - eagacatgcc tgaaacaatc accagccggg atgecgcccg cttccccatc 24 0 
atcgccagct gcacactctt ggggctctac ctctttttca aaatattctc ccaggagtac 300 
atcaacctcc tgctgtccat gtatttcttc gtgctgggaa tcctggccct gtcccacacc 360 
atcagcccct tcatgaataa gttttttcca gccagctttc caaatcgaca gtaccagctg 420 
ctcttcacac agggttctgg ggaaaacaag gaagagatca tcaattatga atttgacacc 4 80 
aaggacctgg tgtgcctggg cctgagcagc atcgttggcg tctggtacct gctgaggaag 54 0 
cactggattg ccaacaacct ttttggcctg gccttctccc ttaatggagt agagctcctg 600 
cacetcaaca atgtcagcac tggctgcatc ctgctgggcg gactcttcat ctacgatgtc 660 
ttctgggtat ttggcaccaa tgtgatggtg acagtggcca agtccttcga ggcaccaata 720 
aaattggtgt ttccccagga tctgctggag aaaggcctcg aagcaaacaa ctttgccatg 780 
ctgggacttg gagatgtcgt cattccaggg atcttcattg ccttgctgct gcgctttgac 840 
atcagc.ttga^agaagaatac Gcacacetac ttctacaeca gctttgcagc ctacatcttc 900 
ggcctgggcc ttaccatctt catcatgcac atcttcaagc atgctcagcc tgccctccta 960 
tacctggtcc c<sgcctgcat cggttttcct ; gtcctggtgg cgctggccaa gggagaagtg 1020 
acagagatgt tcagttatga ggagtcaaat cctaaggatc cagcggcagt gacagaatcc 1080 
aaagagggaa eagaggcatc agcatcgaag gggctggaga agaaagagaa a 1131 

<210> 12 

<211> 1152 

<212> DNA 

<213> Homo sapiens 

<400> 12 

atggcggagc agacctactc gtgggcctat tccctggtgg attccagtca agtgtctaca 60 
tttctgattt ccattcttct tatagtctat ggtagtttca ggtcccttaa tatggacttt 120 
gaaaatcaag ataaggagaa agacagtaat agttcttctg ggtctttcaa tggcaacagc 180 
accaataata gcatccaaac aattgactct acccaggctc tgttccttcc aattggagca 24 0 
tctgtctctc ttttagtaat gttcttcttc tttgactcag ttcaagtagt ttttacaata 300 
tgtacagcag .ttcttgcaac gatagctttt gcttttcttc tcctcccgat gtgccagtat 360 
ttaacaagac <setgeteeacc tcagaacaag atttcctttg gttgctgtgg acgtttcact 420 
getgetgagt , tgGtgt-catt ctctctgtct gtcatgctcg tcctcatctg- ggttctcact 480 
ggccattggc tt'Gtcavtgga tgcactggcc atgggcctct gtgtcgccat gatcgccttt 54 0 
gtccgcctgc egagcetcaa ggtctcctgc ctgcttctct cagggcttct catctatgat 600 
gtcttttggg tatttttctc agcctacatc- ttcaatagca acgtcatggt gaaggtggcc 660 
actcagccgg ctgacaatcc ccttgacgtt ctatcccgga agctccacct ggggcccaat 720 
gttgggcgtg atgttcctcg cctgtctctg cctggaaaac tggtcttccc aagctccact 780 
ggcagccact tctccatgtt gggcatcgga gacatcgtta tgcctggtct cctactatgc 840 
tttgtccttc gctatgacaa ctacaaaaag caagccagtg gggactcctg tggggcccct 900 
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ggacctgcca acatctccgg gcgcatgcag 
ggatactttg taggcctgct cactgctact 
cccgcccttc tctatttggt gccatttact 
aagggcgacc tccggcggat gtggtctgag 
ttcctggaag ta 




aaggtctcct actttcactg caccctcatc 960 
gtggcgtctc gcattcaccg ggccgcccag 1020 
ttattgccac tcctcacgat ggcctattta 1080 
cctttccact ccaagtccag cagctcccga 1140 

1152 



<210> 13 

<211> 339 

<212> DNA 

<213> Mus musculus 

<400> 13 

gtattgggtt tcggagatat cattgtacca 
gatgttcaga ctggttcttc tatatactat 
atgatcatta cctttgttgt cctgatggtg 
ttggtacctt gtacacttat tactgtctca 
aagttctgga aaggcagcag ctatcaggtg 
gaaaatccag tgacgactga tgagcagatt 



ggcctgttga ttgcatattg tagaagattc 60 
atttcatcca caattgccta tgctgttggc 120 
atgaaaacag ggcagcctgc tctcctctac 180 
gtcgttgctt ggagtcgtaa ggaaatgaaa 240 
atggaccacc tggactattc aacaaatgaa 300 
gtacaacag 339 



<210> 14 

<211> 1134 

<212> DNA 

<213> Mus musculus 

<400> 14 

atggattcgg ctgtcagcga tccgcacaac 
ggcacgacgc ggccgccctc cacgcccgag 
ctcatggcgc tgctgcccat cttcttcggc 
aagagctctt cggacatgcc agaaaccatc 
atcgccagct gcacactcct ggggctctac 
atcaacctct tgctgtccat gtatttcttc 
atcagcccct tcatgaataa gttttttcca 
ctcttcacac agggctctgg ggaaaacaaa 
aaggacctgg tgtgcctggg cctaagcagc 
cactggattg ccaacaacct gtttggcctg 
cacctgaaca acgtgagcac tggctgtatc 
ttctgggtat tcggcaccaa cgtgatggtg 
aaattggtgt tcccccagga tctgctggag 
ctgggacttg gagacattgt cattccaggg 
atcagcttga agaagaacac gcacacctac 
ggcctgggtc tcaccatctt catcatgcac 
tacctggtcc ctgcctgcat cggctttcct.. 
gccgagatgt tcagttatga ggagtccaac 
aaagaggagt caacagaggc gtcggcatcg 



ggcagcgccg aggctggcac cccagccaac 60 
ggcatcgcgc tggcctacgg cagcctcctg 120 
gccctgccgt cggtgcgctg cgcccgcggc 180 
accagtcgag atgccgcccg cttccccatc 240 
ctctttttca aaatattctc ccaggagtac 300 
gtgctgggga tcctggccct gtcacacacc 360 
gccaacttcc caaaccgcca gtatcagctg 4 20 
gaagagatca tcaactatga gtttgacact 480 
gtcgttggtg tctggtacct tctgaggaag 54 0 
gccttctccc ttaatggggt agagctcctg 600 
ctgctcggag gactcttcat ctatgacatc 660 
acagtggcca agtcctttga ggcaccaata 720 
aagggccttg aagcagacaa ctttgccatg 780 
atcttcattg ccttactgct tcgttttgac 840 
ttctacacca gcttcgccgc ctacatcttc 900 
atcttcaagc acgcccagcc ggctctcctg 960 
gtcctggtgg. cactagccaa gggagaagtg 1020 
cctaaagatc cagcagccgt gactgaatcc 1080 
aagaggctag agaagaagga ga'aa 1134 
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<210> 15 

<211> 771 

<212> DNA 

<213> Mus musculus 

<400> 15 

cagaacaaga tttccttcgg ttgctgtggg cgtttcactg ctgccgagct gctgtcgttc 60 
tacctgtctg tcatgctcgt cctcatctgg gttctcactg gccactggct tctcatggat 120 
gctctggcca tgggtctctg tgttgccatg atcgccttcg tccgcctgcc aagcctcaag 180 
gtttcctgcc tgcttctctc agggcttctc atctacgatg tcttctgggt gttcttctca 240 
gcctacatct tcaacagtaa tgtcatggtg aaagtggcca cacagccagc tgacaatccc 300 
ctcgacgttc tgtccaggaa gctccacctg ggacccaatg tggggcgtga tgttcctcgc 360 
ctgtctttgc ctggaaaatt ggtcttccca agctccactg gcagtcactt ctctatgctg 420 
ggcatcgggg acattgtgat gcccggcctc ctgttatgct ttgttcttcg ctatgacaac 480 
tacaagaaac aagccagtgg tgactcgtgt ggggcccctg gcanngccaa tatctctggg 54 0 
cgcatgcaga aggtctccta cttccactgc accctcatcg ggtactttgt aggtctgctc 600 
actgcgactg tggcgtctcg cgtccaccga gctgcccagc cagctctcct ctacttggtg 660 
ccatttaccc tattgccact cctcaccatg gcctacctaa agggtgactt acggaggatg 720 
tggtctgagc ccttccactc caagtccagc agctcccggt tcctggaagt a 771 

<210> 16 
<211> 1761 
<212> DNA 

<213> Saccharomyces cerevisiae 
<400> 16 

atggacaagt atttgaattc atttgttgac cacctttcag agtggtcatc tcgtgccttt 60 
aggaacaatt catcaagcgc taaccaaagt gcgtegaaca aggaattaga acaagttttt 120 
gaacagatca atgctatagt tgaaaaccac aataacaaat taaccactgc ctttgataag 180 
atatcatatc gcgttgctca caagattaca cacttggtgg aaagccattc tttagtattc 240 
aactacgcca ctttagttct catcgcaagt gctttggtcg ttattggctc atttacgtct 300 
atttcttcta ttccatttac agctctacct cctacgagag aacactcatt gtttgatcct 360 
acagattttg atgtggacca cgactgtcat gttatctacc gcgagaatga cgaagataaa 420 
aagaaaaaga agaaaagcaa gaggtttttc gatatgatgg atgaaaaaca tgcgattata 480 
ctgcccttaa ctagtggctg tactttactc gctctctatt ttgtgatcaa gaaactacac 540 
ctaaactggc taaaatatgt ggtgaaaatt ttgaatttta atataacact gctaaatatc 600 
ccagctggca catttgtcta ctcctacttt ctcaactcac ttttcagaaa cctatcacat 660 
ttagcttctt ggaatcccct ggttgtttta ccaaggtatc gtgtaacaat agctgatgat 720 
aacgaagacc tgaacaagat aggcgggttt gttaccaatt tgaattacaa agatggattg <7 80 
accaacteag ttgttcaeaa gaaaacattg gatgagattg aaaaagatca ttggatgaag 840 
cattfetetaca gaagagaatt agttgaaccg aaggatatta aatcgaagag gcagatcagc 900 
aacatgtatt tgaatagcgc attaattgtt tcgttcgttc tgtccatcgt ttctaccgta 960 
tatttctatt tatcacccaa tgattggtta_ atatccaatg ctgtcagtat gaatatggct 1020 
atttggtcca ttgctcaatt aaaattgaag aatttaaaat caggggccct aatcctaatt 1080 
gctctatttt tttacgacat ttgctttgtc tttggtaccg atgtaatggt tacagtagct 1140 
actaaccttg atattcccgt aaaactaagc ttaccagtca agtttaatac agctcaaaac 1200 
aacttcaatt tttcaatact tggtctgggt gatattgcct tgcctggtat gtttattgcg 1260 
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atgtgctaca aatatgacat ctggaagtgg 
tttttgaact ggtcatacgt tggaaaatat 
tctttggtat ctgccatggt ctccttgtcc 
tacattgttc cttccttgtt gattagtact 
aagcagtttt ggaattttca gtatgatacg 
atagaaaaaa aggagaactc tataacttat 
gatgccgaca agtatgcctt gcttggtgat 
gaattcgtgc aagaggaaga tctcagtgac 
ctcttggatg acgaatcttc t 




caccttgatc atgatgacac tgaattccac 1320 
tttattactg ctatggttag ttacgttgct 1380 
attttcaata ctgctcaacc ggctttatta 1440 
attttggtag cttgctggaa caaggatttt 1500 
attgaagtgg ataaaagttt aaaaaaagcg 1560 
tcgaccttca tcctatcaga atactataat 1620 
gatgtaaacg aaaattttga cgatgatgaa 1680 
agctctgagg aagagctttc tgaagaagat 1740 

1761 
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ATGGGGCCGCAGCGGCGGCTGTCCCCTGCCGGGGCCGCCCTACTCTGGGGCTTCCTGCTC 

CAGCTGACAGCCGCTCAGGAAGCAATCTTGCATGCGTCTGGAAATGGCACAACCAAGGAC 

TACTGCATGCTTTATAACCCTTATTGGACAGCTCTTCCAAGTACCCTAGAAAATGCAACT 

TCCATTAGTTTGATGAATCTGACTTCCACACCACTATGCAACCTTTCTGATATTCCTCCT 

GTTGGCATAAAGAGCAAAGCAGTTGTGGTTCCATGGGGAAGCTGCCATTTTCTTGAAAAA 

GCCAGAATTGGACAGAAAGGAGGTGCTGAAGCAATGTTAGTTGTCAATAACAGTGTCCTA 

TTTCCTCGCTGAGGTAACAGATCTGAATTTCCTGATGTGAAAATACTGATTGCATTTATA 

AGCTAGAAAGACTTTAGAGATATGAACCAGACTCTAGGAGATAACATTACTGTGAAAATG 

TATTCTGCATCGTGGCCTAACTATGATTATACTATGGTGGGTATTTTTGGAATTGCGGTG 

TTCAGTGGGGCATTAAGTGGATACTGGAGTGGACTAGTTGAATTGGAAAACTTGAAAGCA 

GTGACAACTGAAGATAGAGAAATGAGGAAAAAGAAGGAAGAATATTTAACTTTTAGTCCT 

CTTACAGTTGTAATATTTGTGGTCATCTGCTGTGTTATGATGGTCTTACTTTATTTCTTC 

TACAAATGGTTGGTTTATGTTATGATAGCAATTTTCTGCATAGCATCAGCAATGAGTCTG 

TACAACTGTCTTGCTGCACTAATTCATAAGATACCATATGGACAATGCACGATTGCATGT 

CGTGGCAAAAACATGGAAGTGAGACTTATTTTTCTCTCTGGACTGTGCATAGCAGTAGCT 

GTTGTTTGGGCTGTGTTTCGAAATGAAGACAGGTGGGCTTGGATTTTACAGGATATCTTG 

GGGATTGCTTTCTGTCTGAATTTAATTAAAACACTGAAGTTGCCCAACTTCAAGTCATGT 

GTGATACTTCTAGGCCTTCTCCTCCTCTATGATGTATTTTTTGTTTTCATAACACCATTC 

ATCACAAAGAATGGTGAGAGTATCATGGTTGAACTCGCAGCTGGACCTTTTGGAAATAAT 

GAAAAGTTGCCAGTAGTCATCAGAGTACCAAAACTGATGTATTTCTCAGTAATGAGTGTG 

TGCCTCATGCCTGTTTGAATATTGGGTTTTGGAGACATTAT-TGTACCAGGCCTGTTGATT 

GCATACTGTAGAAGATTTGATGTTCAGACTGGTTCTTCT^FACATATAGTATGTTTCGTCT 

ACAGTTGCCTATGCTATTGGCATGATACTTACATTTGTTGTTCTGGTGCTGATGAAAAAG 

GGGCAACGTGCTCTCCTCTATTTAGTACCTTGCAGACTTATTACTGCCTGAGTTGTTGCC 

TGGAGACGTAAGGAAATGAAAAAGTTC TGGAAAGGTAAGAGC TATCAGATGATGGAC CAT 

TTGGATTCTGCAACAAATGAAGAAAACCCTGTGATATC1FGGTGAACAGATTGTCCAGCAA 
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MGPQRRLSPAGAALLWGFLLQLTAAQEAILHASGNGTTKDYCMLYNPYWT 
ALPSTLENATSISLMNLTSTPLCNLSDIPPVGIKSKAVWPWGSCHFLEK 
ARIAQKGGAEAMLWNNSVLFPPSGNRSEFPDVKILIAFISYKDFRDMNQ 
TLGDNITVKMYSPSWPNYDYTMVGIFGIAVFTGALSGYWSGLVELENLKA 
VTTEDREMRKKKEEYLTFSPLTWIFWICCVMMVLLYFFYKWLVYVMIA 
I FCIASAMSLYNCLAALIHKI PYGQCTIACRGKNMEVRLI FLSGLCIAVA 
WWAVFRNEDRWAWILQDILGIAFCLNLIKTLKLPNFKSCVILLGLLLLY 
DVFFVFITPFITKNGESIMVELAAGPFGNNEICLPWIRVPKLIYFSVMSV 
CLMPVS I LGFGDI I VPGLL I AYCRRFD VQTGS S Y I Y YVS S TVAYAI GM I L 

TFVVLVLMKKGQPALLYLVPCTLITASVVAWRRKEMKKFWKGNSYQMMDH 
LDCATNEENPVI SGEQI VQQ 
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